خزش و رتبه بندی کارا مبتنی بر ویژگی های گراف وب

پایان نامه
چکیده

موضوع پایان نامه به خزش و رتبه بندی صفحات وب اختصاص داده شده است. خزش و رتبه بندی از بخش های مهم در موتور های جستجو می باشند که به ترتیب وظیفه ی بارگذاری صفحات با کیفیت و رتبه بندی نتایج بازگشتی به کاربر را بر عهده دارند. تا کنون الگوریتم های خزش متنوعی پیشنهاد شده اند، اما یا بازدهی مناسبی نداشته اند یا از پیچیدگی بالایی برخوردار هستند. لذا الگوریتم خزش کارایی به نام ieca(intelligent effective crawling algorithm) پیشنهاد می گردد که نسبت به الگوریتم های فعلی از کارایی بالاتر و پیچیدگی پایین تری برخوردار می باشد. در روش پیشنهادی اهمیت صفحات بر اساس چندین ویژگی نظیر درجات ورودی ، فاصله لگاریتمی و خاصیت ساختاری گراف وب (بالابودن درجه ورودی در صفحات با کیفیت) تعیین می گردد. نتایج آزمایشات بر روی چهار گراف مختلف وب (ایران، انگلستان، ایتالیا و گراف وب دانشگاه برکلی) حاکی از کاراتر بودن الگوریتم پیشنهادی نسبت به سایر الگوریتم های خزش می باشد. همچنین بخشی از پایان نامه به مبحث رتبه بندی اختصاص گرفته و مدلی مبتنی بر انتشار شامل دو الگوریتم به نام های hyperlink-based slash-score propagation(hss) و hyperlink-based slash-term propagation(hst) جهت تعیین رتبه ی صفحات پیشنهاد گردید. جهت ارزیابی مدل رتبه بندی پیشنهادی letor 3 مورد استفاده قرار گرفت. بر اساس آزمایشات دو الگوریتم پیشنهادی نسبت به سایر الگوریتم های رتبه بندی انتشاری از دقت بهتری برخوردار هستند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رتبه بندی رأس‌های گراف

یک مسئلۀ مهم در نظریۀ گراف، علوم کامپیوتر و شبکه های اجتماعی، مشخص کردن اهمیت رأس های یک گراف (یا گره های یک شبکه) است. بدین منظور، معیارها و روش های گوناگونی پیشنهاد شده است. یکی از این روش ها، رتبه بندی است که بر پایۀ گا م برداریِ تصادفی بنا شده است. هدف ما در این مقاله، توضیح الگوریتم رتبه بندی به دو شکل متمرکز و توزیع شده است. به این منظور، نخست مفهوم رتبه بندی و الگوریتم محاسبۀ آن را به صور...

متن کامل

رتبه بندی وب سایت های عفونی ویروسی براساس معیار WHO و سیلبرگ

Introduction: The growth of internet health information with unclear quality endangers Users' health and lives. The necessity of evaluating intrenet sources including web has been proven, in many studies. Therefore, applicable solutions for evaluating internet information in web are suggested, one of which is the systematic rating of web information using a criteria and based on different aspec...

متن کامل

رتبه بندی وب‌سایت‌های دانشکده های داروسازی ایران با استفاده از ضریب تاثیرگذار وب

       Introduction: Considering the importance of websites in informing users and establishing communications, universities have started to design their own websites for organizing and making their information accessible. Evaluation of these websites through webometric methods will help recognize pitfall and strong points to reach a better quality and constant improvement. This study was aimed...

متن کامل

رتبه بندی واحدهای کارا با داده های مثبت و منفی

چکیده تحلیل پوششی داده ها یک روش ناپارامتری جهت اندازه گیری کارایی یک مجموعه از واحدهای تصمیم گیرنده (dmu)نظیر شرکت ها، بانک ها، کتابخانه ها، مراکز آموزشی، بیمارستان ها و غیره می باشد. روش های پایه ای تحلیل پوششی داده ها فقط برای داده های نامنفی مورد استفاده قرار می گیرند. در سال های اخیر، مدل هایی برای محاسبه کارایی واحدهایی کهدارای متغیرهای ورودی یا خروجی منفی هستند، پیشنهاد شد. اما این روش ...

15 صفحه اول

ترکیب خودکار سرویس‌ها مبتنی بر گراف رنگ‌آمیزی

سرویس‌های وب به‌عنوان مؤلفه‌های نرم‌افزاری مستقل توسط ارائه‌دهندگان سرویس بر روی اینترنت منتشر شده و توسط درخواست‌کنندگان سرویس برای رسیدن به اهداف مختلف فراخوانی می‌شوند. با این حال در بسیاری از موارد هیچ سرویسی به‌تنهایی در مخزن سرویس یافت نمی‌شود که بتواند رضایت درخواست‌کننده را برآورده سازد. ترکیب سرویس، مؤلفه‌های جدیدی را با استفاده از یک مدل تعاملی برای سرعت بخشیدن به برنامه‌ها ایجاد می‌ک...

متن کامل

بخش بندی مشتریان داروهای گیاهی و شناسایی ویژگی های هر بخش در ایران مبتنی بر الگوی خوشه بندی

یکی از محورهای قابل دسترسی جهت تحقق اهداف توسعه انسانی، اجتماعی و اقتصادی، توجه به صنعت داروهای گیاهی است. افزایش شاخص هایی نظیر اشتغال، رفاه مصرف کنندگان، نرخ رشد درآمد سرانه و صادرات که از شاخص های توسعه یک کشور هستند، از طریق توجه به پتانسیل بالقوه‌ای که در این بازار وجود دارد، محقق شدنی است. شناسایی تقاضای بازار به عنوان یکی از شاخص های سنجش اقتصادی، نیازمند بازاریابی هدفمند است. نقطه آغاز ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023